一种用于构建人类外显子靶向捕获文库的可扩展自动化流程
A scalable, fully automated process for construction of sequence-ready human exome targeted capture libraries
一种用于构建人类外显子靶向捕获文库的可扩展自动化流程
基因组靶向捕获能够以低成本的方式对基因组的特定区域进行测序。本文提出了一种用于液相杂交捕获的可自动化、能高度扩展的方法。该方法在测序文库准备的规模和通量上都具有显著提升,并对重要实验流程进行了改进和一系列质控添加。并且,这些改进也可以在手动建库流程中使用。
随着测序技术的创新,测序成本持续下降,因此,用于人全基因组的商业化测序越来越多。伴随着对基因组特定区域测序的发展趋势,制备目标区域测序样本的方法也在不断创新,特别是对于癌症和遗传病相关的外显子以及特定疾病相关的蛋白编码基因测序。利用靶向富集进行全外显子测序的方法发现多种罕见的疾病突变,同时伴随其经济的价格成为目前极具吸引力的测序选择。
在测序成本的降低条件下,通过优化样品制备的费用成本,可以更加提高靶向测序的经济效益。本文所采用的方法为Solution hybrid selection (SHS),以安捷伦SureSelect Human全外显子v2商用试剂盒为例,可以对基因组中多个区域序列进行高效靶向富集,且适用于NGS技术。
相比其他方法,SHS方法的通量要高得多,且该过程也可以使用排枪手动进行。通过对SHS的拓展以及优化,以提高目标覆盖的选择性和均匀性,在将人工重复最小化的同时持续提供大于94%的线性外显子组。自动化流程能够在不到一周的时间内,4名技术人员处理超过1200个SHS样本。
一个随机剪切的DNA接头连接片段化文库(Pond)和与目标序列互补的生物素化标记的RNA(bait)进行杂交。然后,杂交分子(the catch)被链霉亲和素包覆的磁珠捕获。一旦捕获的DNA片段用捕获试剂被PCR扩增以后,就可以使用NGS对其进行测序。本文主要描述以下方面的优化改进:全自动化的磁珠纯化代替电泳纯化;采用自动化流程以后通量增加,自动化SHS流程是在Bravo liquid handling workstation 上进行(这个流程也可以使用排枪手动进行)。
该过程使用Covaris E210自适应聚焦声学仪器进行基因组DNA片段化。可以在期望的片段大小范围内最大限度地增加DNA片段的产量是减少总样本损失的关键步骤。具体原理为通过仪器将声波聚焦到一个小的局部区域,从而产生双股断裂的DNA。控制平均片段长度和分布的变量包括占空比、频率的周期和时间。相比其他方法(如雾化或水动力)的优点在于:DNA剪切是在一个小的封闭环境中进行的,而不是在大容量的容器或离心管中进行处理,大大减少了样品的损失,极大地减少了样品的交叉污染;Covaris机器每次运行可以自动操作多达96个样品,消除了大量的样品处理和片段化剪切的手动操作;剪切流程的改进与随后基于磁珠的小片段纯化步骤相结合,消除了从琼脂糖凝胶中选择大小和提取样本的需要。
SHS扩展的另一个关键是可以在标准的96孔微滴板中进行固相可逆固定化(SPRI)磁珠的纯化反应,称之为“with-bead”SPRI。在SHS中实现with-bead SPRI具有显著的优势:用与移液枪兼容的磁珠式清洗代替了单管离心柱式清洗;通过消除或合并几个步骤来简化片段大小的选择过程,从而得到更高的DNA产量。
目前纳米级别的磁珠基础结构分为三层,最内层的是聚苯乙烯,第二层包裹磁性物质(通常是Fe3O4),最外层是修饰的官能团(如羧基)。其中官能团能与核酸结合,表面基团不同,下游的应用也不尽相同,如核酸提取,纯化,生物素捕获等。商业化磁珠产品体系一般包含:磁珠、聚乙二醇(PEG)、盐离子等。基于SPRI技术, DNA在一定浓度的PEG存在条件下,NaCl或MgCl2促进条件下,DNA分子构象会发生急剧变化,暴露出磷酸骨架上大量的带负电荷的磷酸基团,与表面带负电荷的羧基磁珠结合。带负电磷酸基团借由解离的盐离子(如Na+)与羧基形成离子桥,使DNA被特异性吸附到羧基磁珠表面。利用磁珠的磁性,可通过外加磁场进行收集洗脱。
操作原理:DNA纯化的目的在于去除不想要的片段,由于磁珠优先吸附大片段,因而可通过一定比例的磁珠吸附特定大小以上的片段,丢弃上清(去除非目标片段)后将磁珠吸附的DNA洗脱回收。
SPRI磁珠的纯化流程
采用磁珠纯化的创新点在于:与手动建库的离散纯化步骤不同,磁珠纯化是有效集成的;片段化剪切后,SPRI珠子被添加到样品中,并在整个样品制备过程中保持在反应容器中;通过每个清洗步骤使用相同的磁珠大大减少了液体转移的所需步骤;最后“纯化”干净的DNA被洗脱;这种方法提高了DNA的总产量。
为了适应规模的增加样品的自动化处理,所有缓冲液和非酶组分以适合96个样品的体积加引物进行预混和到固定体积。使用之前,预混的试剂只需要解冻并放在反应板上,在分配到反应板之前立即加入酶。
手动流程中最耗费劳力的步骤是“捕获”,将杂交后DNA-RNA结合双链从未结合的片段中分离出来。分离是使用能与生物素分子结合的链霉亲和素磁珠,而生物素分子与RNA诱饵共价连接。没有杂交到生物素化RNA诱饵的片段通过一系列的清洗去除。纯化条件经过重新设计,与自动化液体处理兼容,并优化了最大产量。
由于自动化移液体积比人工过程中使用的标准体积要小得多,因此清洗循环的次数增加了,而且每次清洗的体积必须减少来适应微管大小,同时保持适当的严格程度。清洗缓冲液的温度精确控制是通过将包含缓冲液的容器存储在温度校准为65 ℃的加热块中,再集成到液体机器处理平台上。这种自动化提供了一种无需人工干预的捕获流程,能够在4小时内为96个样品持续设置捕获反应。此外,自动化过程提供了质量更一致的输出,并消除了手动跟踪和输送错误。
用PCR法直接放大捕获序列来取代洗脱,这个过程称之为“off-bead”PCR,因为PCR的目标是直接从捕获磁珠上扩增。此步骤通过去除了移液步骤来简化过程,消除了此过程的可变性,可以提高捕获产品产量大约3倍。
随着测序规模的扩大,样本质量和成功测序作为产生高质量测序结果的重要指标。因此,在流程中实施了一系列的在线质量控制检查点能够对SHS过程的度量进行精准报告。通过质控快速识别和移除性能不佳的样品,避免发生相关成本。
在线质控点主要设有:溶液体积检查;用PicoGreen检测样品浓度;剪切DNA的大小质量控制;自动化性能质量控制;平台自动化配置的操作确认;对杂交文库PicoGreen进行浓度测定;定量PCR对捕获文库的定量分析。除了在线检测外,每个96孔板样品都包含用于质量评估的对照DNA(两个阳性和一个阴性)。在整个过程中建立的控制检查点为每一步的性能和整体质量问题提供早期筛查。此外,还有匹配系统识别的样本信息条形码进行流程跟踪和保证实验完整性。
随着单个样本的测序成本降低,靶向测序方法在癌症、人类遗传疾病和全基因组关联研究验证等领域的需求快速增长。然而,获得有意义的统计结果需要的大量样本数据。改进后自动化流程可以在保持高捕获效率和高文库复杂度的情况下通量大幅度提升。
自动化和规模化的SHS创新和优化,消除了大量的液体处理步骤,同时大大减少了样品损失。而本文描述的改进并不局限于SHS的应用,同时也可以应用于二代测序的各种样品制备工艺,以及任何可用的测序技术平台。
通过对PCR扩增和杂交捕获步骤的优化,极大地提高了目的产物的产量,并将错误和重复序列最小化降低。增加了一系列的过程质制点可以很容易地在昂贵的测序步骤发生之前识别出问题。最后,通过端到端的样本条码进行全面的样本跟踪,消除了样本处理和跟踪误差。从而保证高通量的样品文库制备。
一个训练有素的实验室技术人员利用SHS流程可以一次性完成96孔板实验,也可以很容易地通过增加孔板硬件增加到更大的数量。同时,对于少量的样本量,利用优化后SHS过程的技术改进也可以通过排枪手动进行。
靶向测序的应用正变得越来越广泛,大量的研究应用靶向测序,特别是在癌症和人类遗传疾病领域。为了对大量样本进行高效和经济的靶向测序,自动化、大规模和完全跟踪的靶向测序过程是必不可少的。
优化SureSelect靶向捕获方案来适应FFPE样本进行Illumina多重测序 | 前沿技术